查看原文
其他

打开R语言的大门

Biomamba Biomamba 生信基地 2023-06-15
一、关于R
对于生物信息学来说,除了形形色色的软件以外,能够做到一个平台就能够处理形形色色的数据的,便只有R、Python与Linux。但这三者也有所区别,首先R与Python是计算机的基本语言、而Linux则是系统。简单来说Linux的维度会更高一些,也正是因为这个原因,R的环境配置与上手会更快(这点是鉴于笔者安装数次Ubuntu虚拟机失败后的深刻体会)。

首先,先简单介绍一下R语言,R语言是由奥克兰大学的Robert Gentleman和Ross Ihaka以S语言为基础所开发,由于二位创始人的名字都由R开头而得名。这款软件开发的初衷便是为了统计并处理数据、绘制图形,可以说R语言本是一个统计软件(个人感觉大概就相当于SPSS的内核)。而Robert Gentleman本人是一个生信学家,这也为R语言在生信方面的应用埋下了伏笔。

另外,有必要说一说笔者安利R的原因:
1、最重要也最现实的原因是R语言为一个免费、开源的软件,这一点为科研人员提供了很大的便捷,也大大促进了大家互相交流(这一点购买过license的实验室应该会深有体会)。
2、R语言是一种具有扩展功能的软件,由于其是一种语言平台,因此各路R的爱好者会基于R语言开发形形色色的扩展包(如绘图神器ggplot,用于单细胞测序分析的Seurat),扩展包的开发导致R语言可以说是一个万能的神器,大家可以通过在R中安装不同的扩展包来实现更多的功能。可以说,使用R语言,其实就是利用其中的扩展包。
3、R语言易于学习,各种命令与源代码可以在作者的Github之中查找,或在R中直接使用help命令查找扩展包的使用方法。

4、R语言强大的互动性:从上游来说,扩展包与数据都可以直接在R中通过命令很方便的下载(甚至可以用R语言直接抓取并处理网站上的数据);下游来说,数据、图表都可以通过命令做个性化编辑。

5、当然,天下从来就没有免费的午餐,R语言也必然有一些缺点。由于R语言是一个开源、免费的软件,因此就没有那些付费软件完善的售后服务(说白了就是需要自己学习)。另外我们刚才提到过,R语言的强大功能源于其众多的扩展包,也就是说,各种扩展包的学习会让R的爱好者投入更多的精力与时间成本


二、R的安装:打开R的官网(https://www.r-project.org/),点击下图红框中的CRAN即可选择镜子开始下载。这里有必要介绍一下,由于R语言是新西兰的工作者所开发,而其又普遍全球,因此受各个地方“网络隔离”的影响,会造成扩展包、数据的下载的网络障碍;镜子便是由各个地方的工作者维护的镜像网站。目前中国一共有分别由清华、中科大、香港的KoDDoS、兰州大学、同济大学、厦门大学维护的几个镜像网站(都在国内,选哪个都不影响速度)。下载后的安装也无需特殊的设置,与其他windows下的软件一样选择路径安装即可,需要注意的是R语言的安装路径需要避免存在中文与特殊字符。



三、RStudio:是R语言的编辑器,说白了相当于外挂,可以自动帮助使用者补齐或纠正命令,你值得拥有(https://rstudio.com/)。

最后,笔者曾经整理过一些R语言的基本操作命令,由于目前还没有开学,这部分就等开学拿到工作电脑后再更啦。




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存